扫描下载APP
其它方式登录
智谱AI作为国内领先通用大模型公司,凭借GLM-5系列模型在编程、智能体等场景的高性能与低延迟优势,实现市值超5700亿港元、年内涨10倍;其MaaS平台营收三年增长12倍,API调用量激增,但高算力投入致亏损扩大,毛利率下滑,凸显商业化潜力与盈利压力并存。
DeepSeek在获得700亿元融资后,战略重心转向AI Coding领域,全力推进桌面端代码Agent产品‘DeepSeek Code Harness’的研发,对标Claude Code和Codex;通过引入量化交易背景的崔添翼、模型结构专家徐名宇等关键人才补强Harness团队,并加速适配国产算力(如华为昇腾),旨在将大模型能力深度嵌入开发者真实工作流。
智谱(02513.HK)因发布GLM-5.1高速版API,实现400 tokens/s全球领先推理速度,单日股价暴涨近30%。该突破依托TileRT推理引擎、MLA注意力机制与ZCube网络架构三层技术创新,在不牺牲模型能力前提下显著提升吞吐、降低尾延迟并节省三分之一网络成本,重塑AI基础设施效率边界。
阿里云MaaS业务Token收入5个月内增长15倍,核心驱动力是面向Agent(尤其是Coding场景)的全栈技术升级:发布Qwen 3.7 Max强化长程任务与代码能力,推出专为Agent设计的千问云官网,并通过平头哥芯片、Infra及模型深度协同,推动高质量Token消耗进入企业核心生产流程,实现AI云收入跃升。
Anthropic凭借聚焦coding的战略选择和以安全使命为核心、高信任低ego、强人文底色的组织文化,在AI行业中实现爆发式增长与高人才留存率,其成功源于对scaling laws的坚定信念、严格的使命导向招聘及创始人团队从百度和OpenAI经历中形成的反向文化建构。
文章聚焦AI Coding浪潮的兴起,以蚂蚁灵光App为标志性产品,揭示国内大厂(百度、字节、腾讯)密集入局趋势,指出AI正将软件开发门槛大幅降低,催生‘次抛型App’和‘超级个体开发者’现象,推动应用开发从专业能力向大众日常能力平权转变。
智谱通过聚焦To B端API服务,尤其是编程场景的GLM Coding Plan,实现Token调用量和ARR爆发式增长,模仿Anthropic商业化路径,以‘模型即生产力’逻辑推动高定价、高消耗的量价模型落地,成为国内营收最大、增速最快的大模型公司。
AI创作平台灵珠启动第二次内测,取消邀请码限制实现全开放体验,全面接入DeepSeek V4大模型使需求分析效率提升约3倍,并优化界面交互;平台聚焦低门槛Vibe Coding,吸引学生、家长、医生等非技术用户深度创作,单日token消耗超50亿,验证了AI辅助应用开发的大众化潜力。
智谱发布GLM-5V-Turbo,聚焦原生多模态智能体研发,通过自研视觉编码器CogViT、多模态多Token预测(MMTP)和超大规模多任务强化学习,提升视觉感知与GUI操作能力,推动AI从文本理解迈向工作流接管,探索按交付项目计费的新商业范式。
文章分析智谱、MiniMax等中国AI公司在五一后股价大涨的原因,指出其核心驱动力并非单纯低价或模型蒸馏,而是通过底层工程优化(如KV Cache修复、投机采样异常监控、调度改进)显著提升推理吞吐量与稳定性,将AI性价比从‘token单价’升级为‘任务单价’,推动调用量激增和估值逻辑转向工程能力壁垒。
文章探讨AI编程(vibe coding)如何重塑开发者生态:降低技术门槛,推动00后、10后等年轻群体及独立开发者快速产出创意产品;编程正从‘古法’极客文化转向强调创意、传播与共情的新范式;同时指出算力仍是国内开发者的现实瓶颈。
DeepSeek发布V4系列大模型,大幅降价并实现百万上下文、CSA+HCA混合注意力、华为昇腾950PR全栈适配等关键技术突破;在硅谷巨头面临算力危机与Agent时代成本敏感性上升的窗口期,以国产算力低成本优势切入Agent基础设施赛道,推动国产AI生态升级与产业链协同。
文章分析AI行业从通用大模型转向Agentic Coding的结构性转变,指出OpenAI与DeepSeek同日发布GPT-5.5和DeepSeek-V4预览版,均以代码理解与生成能力为核心;揭示Coding Plan订阅模式因Agent高算力消耗而崩溃,行业集体转向按Token计费,并迈向按结果付费的终局,强调效率与能力并重的新竞争范式。
火山引擎上线方舟Coding Plan,整合GLM-5.1、Kimi K2.6、DeepSeek-V3.2等多款国产大模型,推出低价订阅套餐,但用户反馈限额过严、算力调度不稳、抵扣规则不透明;阿里云、腾讯云、百度千帆等加速布局‘模型超市’,行业竞争从单模型转向平台整合与生态服务能力比拼,大模型公司面临‘管道化’压力,正通过智能体、垂直场景、多源分发等路径突围。
文章分析小米最新大模型MiMo-V2.5和V2.5-Pro的技术突破,重点在于长程Agent能力、多模态融合、百万级上下文及高token效率;同时解读其推出的Token Plan订阅服务,标志着小米从硬件公司向AI基础设施服务商的战略转型,并探讨开源承诺、工程可复现性与商业化落地的关键挑战。